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摘 要 准确 解码 语音 中 的 情绪 信息 能 让 个 体 更 好 地 适应 社会 环境 , 此 能 力 对 新 生 儿 和 婴儿 
要 ， 因 为 人 类 刚 出 生 时 听觉 系统 远 比 视觉 系统 发 育 得 完善 。 虽 然 已 有 研究 表明 5~7 
月 龄 的 婴儿 能 分 辨 不 同情 绪 种 类 的 语音 , 但 目前 对 新 生 儿 的 研究 还 非常 少 。 人 类 是 否 在 出 生 
时 即 具有 分 辨 不 同 种 类 情绪 性 语音 的 能 力 ? 新生 儿 对 情绪 的 加 工 是 否 存 在 正 性 或 负 性 偏 
向 ? 本 文选 用 odd-ball AREAREN, RA. 愤怒 三 种 韵律 性 语音 在 1~6 天 龄 新 生 儿 大 脑 
诱发 的 事件 相关 电位 。 实 验 1 直接 对 比 三 种 情绪 性 条 件 ， 发 现 新 生 儿 大 脑 的 额 区 (F3 和 F4 
电极 点 ) 可 以 区 分 情绪 性 语音 的 正 负 性 ， 正 性 (高兴) 语音 诱发 的 “ 失 匹 配 反 应 ”幅度 明显 大 
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FE CCR AUR TA) 语音 。 实 验 2 采用 偏差 和 标准 刺激 反 转 的 odd-ball 范式 ， 证 实 了 实验 
1 的 结果 并 非 源 于 三 种 情绪 语音 物理 属性 的 差异 。 本 文 的 结果 提示 ， 新 生 儿 大 脑 可 自动 辨别 
下 性 与 钠 性 情绪 语音 , 但 尚 不 能 将 愤怒 和 恐惧 两 种 负 性 语音 区 分 开 来 。 更 重要 的 是 , 高 兴 语 
音 比 两 种 负 性 语音 诱发 了 更 大 的 失 匹 配 反 应 ,这 一 结果 首次 从 神经 学 层面 ( 电 生 理 指标 ) 为 
新 生 儿 情绪 性 语音 加 工 的 正 性 偏向 提供 了 证 
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语音 ( 即 人 发 出 的 说 话 声 ) 是 我 们 在 日 常生 活 中 接触 最 为 频繁 的 声音 类 型 ， 它 不 仅 能 传 


递 语 义 信 息 ， 还 能 传达 说 话 人 的 情绪 状态 (Belin, Fecteau, & Bédard, 2004)。 对 语音 中 情绪 信 


息 的 准确 解码 能 让 个 体 更 好 地 适应 社会 环境 (Decety & Howard, 2013; Friihholz & Grandjean, 
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2013; Hawk, Van Kleef, Fischer, & Van der Schalk, 2009)。 在 生长 发 育 早 期 ， 新 生 儿 “年 龄 为 
0~28 K) 及 婴儿 (年龄 为 1~12 A) 的 听觉 系统 比 视觉 系统 发 育 得 更 加 完善 ， 因 此 语音 中 的 
情绪 比 面孔 等 视觉 载体 所 传达 的 情绪 对 婴儿 的 生存 和 发 展 更 为 重要 (Grossmann, 2010; Vaish, 
Grossmann, & Woodward, 2008; Vaish & Striano, 2004). 

语音 中 的 情绪 可 由 语义 传达 , 也 可 通过 声音 的 频率 、 响 度 及 节律 等 特征 的 有 机 组 合 而 表 
iA(Briik, Kreifelts, & Wildgruber, 2011)。 考 虑 到 小 婴儿 尤其 是 新 生 儿 尚 不 具备 语义 理解 的 能 
力 ， 本 文 仅 探讨 对 后 者 ， 即 对 语音 中 情绪 性 韵律 (emotional prosody) 的 加 工 。 新 生 儿 的 听觉 
系统 已 完全 具备 了 加 工 音调 的 能 力 (Hiaden et al., 2009), 其 大 脑 的 右 侧 ( 相 比 于 左 侧 ) 显 上 沟 
壬 中 回 会 被 语音 中 变化 的 韵律 显著 激活 (Arimitsu et al., 2011; Telkemeyer et al., 2009), 同时 
他 们 的 额 叶 对 音调 不 停 变 化 的 语音 ( 相 比 于 音调 一 层 不 变 的 语音 ) 有 特异 性 的 激活 ， 这 些 结 
果 提 示 此 发 育 阶段 的 大 脑 已 可 区 分 语音 中 不 同 的 韵律 横 式 (Saito et al., 2007)。 在 情绪 性 语音 


《或 旋律 ) 加 工 方面 ， 虽 然 已 有 研究 表明 ，5 月 龄 的 婴儿 在 听 音 乐 时 能 区 分 悲伤 和 高 兴 的 旋 


律 (Flom & Pick, 2012), 5~7 月 龄 的 婴儿 能 分 辨 不 同情 绪 种 类 的 语音 (Flom & Bahrick, 2007), 


7 月 龄 的 婴儿 能 捕捉 到 面孔 与 语音 中 一 致 性 的 情绪 信息 (Grossmann, Striano, & Friederici, 


co 2005)， 但 目前 对 人 类 刚 出 生 的 时 期 ， 即 新 生 儿 阶段 的 研究 还 非常 少 。 
© 人 类 是 否 在 出 生 时 即 具有 分 辩 不 同 种 类 情绪 性 语音 的 能 力 ? 如 果 有 , 新 生 儿 对 情绪 的 加 
= 工 是 否 存在 正 性 或 负 性 偏向 ? 这 第 二 个 问题 的 提出 基于 以 下 事实 ; 已 知 儿童 、 青 少年 、 成 年 


人 对 情绪 信息 的 加 工 存在 负 性 偏向 (negativity bias)， 即 对 负 性 信息 投入 更 多 的 注意 、 评 价 、 
记忆 等 认 知 资源 (Ito, Larsen, Smith, & Cacioppo, 1998)， 但 此 情绪 加 工 的 负 性 偏向 似乎 并 不 
是 与 生 俱 来 的 。Vaish 等 人 (Vaish et al., 2008) 总 结 了 基于 面孔 和 语音 的 研究 发 现 ， 婴儿 在 6~7 
月 龄 后 才 表 现 出 明显 地 对 负 性 情绪 的 加 工 偏向 。 例如， 视觉 通路 的 研究 表明 ，6 月 龄 婴儿 的 
FAR ER GAFR) 面孔 注视 的 物体 表现 出 更 大 的 中 央 区 事件 相关 负 成 分 (Hoehl & 
Striano, 2010); 7 HAR ZJLA ÆR CREE eS) 面孔 的 注视 时 间 更 长 ， 中 央 区 负 成 分 的 幅 


度 更 大 (Peltola, Leppänen, Maki, & Hietanen, 2009)。 听 觉 通路 的 研究 表明 , 7 月 龄 婴儿 的 大 脑 


对 愤怒 ( 相 比 于 高 兴 和 中 性 ) 语 音 表现 出 右 侧 颗 叶 的 显著 激活 (Grossmann, Oberecker, Koch, & 
Friederici, 2010)， 且 额 区 及 中 央 区 呈现 出 更 大 的 事件 相关 负 成 分 (Grossmann et al., 2005)。 而 
支持 早期 正 性 加 工 偏向 的 研究 显示 ，5 月 龄 婴儿 在 听 赞 赏 性 ( 相 比 于 责备 性 ) 语音 时 表现 出 
更 多 的 微笑 反应 (Fernald, 1993); 4 月 龄 婴儿 对 高 兴 面 孔 注 视 的 时 间 明 显 长 于 愤怒 和 中 性 面孔 
(LaBarbera, Izard, Vietze, & Parisi, 1976)， 同 时 他 们 对 高 兴 〈( 相 比 于 恐惧 ) 面孔 注视 的 物体 显 
示 出 更 大 的 额 区 及 中 央 区 负 成 分 (Rigato, Farroni, & Johnson, 2010)。 然 而 ， 上 述 针对 正 负 性 
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情绪 加 工 偏向 的 研究 仅 考察 了 月 龄 大 于 3 月 的 婴儿 , 目前 对 小 月 龄 婴儿 特别 是 新 生 儿 的 相关 
报道 还 非常 少 。 

据 我 们 所 知 , 仅 有 三 项 研究 直接 比较 了 新 生 儿 对 正 性 和 负 性 情绪 材料 的 加 工 。 较 早期 的 
一 项 行为 学 研究 发 现 ,与 愤怒 、 翡 伤 和 中 性 的 语音 相 比 ,高兴 语音 能 在 新 生 儿 被 试 中 引起 更 
长 时 间 的 睁 眼 反 应 (Mastropieri & Turkewitz, 1999)。 更 近期 的 一 项 行为 学 研究 考察 了 新 生 儿 


对 高 兴 和 疏 惧 面孔 的 注视 时 间 , 发 现 他 们 对 高 兴 面 孔 的 注视 时 间 更 长 (Farroni, Menon, Rigato, 


& Johnson, 2007)。 随 后 Cheng 等 人 (Cheng, Lee, Chen, Wang, & Decety, 2012) 利 用 odd-ball 范 
式 研究 了 新 生 儿 对 情绪 性 语音 加 工 的 事件 相关 电位 (event related potential, ERP), 首次 为 新 生 
儿 区 分 语音 情绪 提供 了 神经 学 层面 ( 电 生 理 指标 ) 的 证 据 。 该 研究 发 现 恐 惧 语音 比 高 兴 语音 
在 额 -中 央 区 诱发 出 了 更 大 的 失 匹 配 电位 。 由 于 该 ERP 成 分 在 新 生 儿 中 表现 为 正 幅 度 


(Dehaene-Lambertz, 2000; Friederici, Friedrich, & Weber, 2002; Leppänen et al., 2004; 


Ruusuvirta, Huotilainen, Fellman, & Näätänen, 2009; Winkler et al., 2003), 与 通常 在 成 人 中 发 现 


4 的 失 匹 配 负 波 极 性 相反 ， 我 们 称 该 成 分 为 “ 失 匹 配 反 应 ”"(mismatch response, MMR; Cheng et 
m al., 2012; Zhang et al., 2014)。 显 然 地 ， 在 新 生 儿 阶段 仅 有 的 三 项 研究 对 情绪 加 工 的 正 负 性 偏 
00 向 给 出 了 相反 的 答案 : 前 两 项 行为 学 实验 支持 正 性 偏向 而 Cheng 等 人 (2012) 的 实验 支持 负 性 
偏向 。 

综 上 所 述 ， 目 前 对 新 生 儿 情绪 性 语音 加 工 的 研究 还 非常 缺乏 ， 且 在 “情绪 加 工 的 正 负 性 
偏向 ”问题 上 出 现 了 看 似 矛 盾 的 结论 。 新 生 儿 被 试 是 一 组 特殊 的 群体 ， 他 们 无 法 按照 主 试 的 
意愿 安静 并 专注 地 完成 实验 , 在 实验 中 的 运动 伪 迹 等 会 对 行为 学 及 神经 学 指标 产生 较 大 的 干 
Dh, 因此 对 新 生 儿 群体 的 研究 往往 需要 累积 较 多 的 证 据 才 能 得 出 相对 可 靠 的 结论 。 本 研究 即 
以 此 为 目的 ， 我 们 拟 通过 两 项 实验 ， 利 用 ERP 技术 考察 新 生 儿 对 高 兴 、 愤 怒 、 恺 惧 语 音 包 
大 脑 反 应 。 参 考 Cheng 等 人 (2012) 的 研究 ， 本 实验 采用 odd-ball 范式 播放 语音 材料 ， 这 是 因 
为 该 范式 比 其 他 被 动 任务 范式 (例如 两 类 刺激 以 等 概率 播放 ) 在 检测 被 试 对 不 同 刺激 的 分 辨 
能 力 方面 具有 更 高 的 敏感 性 (Ferrari,，Bradley，Codispoti, & Lang, 2010)。 实 验 1 采用 经 典 的 
odd-ball 范式 ， 在 三 个 block 中 分 别 诱发 三 种 情绪 语音 相应 的 ERP 波形 ， 通 过 直接 比较 三 种 
条 件 下 的 MMR 幅度 考察 新 生 儿 大 脑 对 正 负 性 情绪 的 敏感 性 ,实验 2 采用 偏差 和 标准 刺激 反 
转 的 odd-ball 范式 , 一 方面 重复 验证 实验 1 的 结果 , 一 方面 排除 实验 1 中 情绪 间 MMR 的 差 
异 来 源 于 情绪 语音 物理 属性 差异 的 可 能 性 。 在 本 次 研究 中 ,我 们 采用 了 与 Cheng 等 人 (2012) 
相同 的 实验 材料 。 根 据 Cheng 等 人 (2012) 的 结果 ， 本 文 假设 人 类 出 生 后 即 具 有 分 辨 正 负 情 
绪 性 语音 的 能 力 ， 并 且 可 能 对 负 性 情绪 存在 一 定 的 加 工 偏向 ， 即 愤怒 和 (或 ) 恐惧 语音 比 高 
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实验 在 北京 大 学 第 一 医院 儿科 病房 进行 ,病房 背景 噪声 约 30dB SPL ( 希 玛 噪音 计 AS804, 
东莞 万 创 电 子 制 品 有 限 公 司 ,， 东莞， 中国)。 语 音 材料 通过 入 耳 式 主动 降 噪 耳机 播放 
(IER-NW500N, Sony Corp., Tokyo, Japan)， 平 均 响 度 为 50 dB SPL. 

被 试 进食 结束 后 10 min 开始 实验 准备 (安置 脑 电 电极 等 ), 准备 过 程 少 于 10 min. 之 后 
保持 实验 室 安 静 ， 让 被 试 进入 自然 睡眠 。 实 验 过 程 中 采用 “振幅 整合 脑 电 图 ”技术 (Olympic 
CFM 6000, Natus, Seattle, USA) 实 时 监测 被 试 的 睡眠 -觉醒 状态 (图 2A)， 振 幅 整 合 脑 电 图 的 
电极 放置 于 CP3 及 CP4 位 置 ， 该 睡眠 监测 仪 与 本 研究 考察 的 脑 电信 号 系统 独立 。 被 试 一 旦 
进入 “活动 睡眠 ”状态 (active sleep， 相 当 于 成 人 的 快速 眼 动 睡眠 期 ) 并 稳定 3~5 min 后 开始 播 
放 语 音 材料 。 振 幅 整 合 脑 电 图 技术 及 新 生 儿 睡眠 分 期 可 参考 本 课题 组 前 期 发 表 的 相关 文献 


(Zhang et al., 2011; 2014). 


实验 采用 oddball 范式 (Cheng et al., 2012; Zhang et al., 2014)， 被 试 在 睡眠 中 被 动 收 听 情 
绪 性 语音 材料 。 按 照 情绪 条 件 ， 被 动 收 听任 务 包含 高 兴 、 慎 怒 、 恐 惧 3 A block, block 之 间 
有 10 s KEIR, block 的 顺序 在 被 试 间 平衡 。 每 个 block 500 个 试 次 ， 其 中 标准 刺激 400 


个 试 次 , 偏差 刺激 100 个 试 次 。 每 两 个 偏差 刺激 之 间 至 少 含 两 个 标准 刺激 。 每 条 语音 刺激 长 
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度 为 330 ms， 刺 激 间隔 为 430~850 ms (Hirasawa, Kurihara, & Konishi, 2002; Zhang et al., 


2014)， 即 每 个 block 的 500 个 试 次 共用 时 500s (8.3 min). 

实验 1 含 一 个 session， 每 名 新 生 儿 收听 高 兴 、 人 愤怒、 恐惧 各 1 个 block， 情 绪 语 音 作为 
偏差 刺激 ， 中 性 语音 作为 标准 刺激 。 实 验 2 含 两 个 session， 每 个 session 包括 高 兴 、 人 愤怒 、 
恐惧 各 1 个 block。 在 其 中 一 个 session tH, 情绪 语音 作为 偏差 刺激 , 中 性 语音 作为 标准 刺激 ; 
而 在 另 一 个 session 中 偏差 和 标准 刺激 反 转 ， 即 情绪 语音 作为 标准 刺激 ， 中 性 语音 作为 偏差 
刺激 。 每 名 新 生 儿 进行 两 个 session 的 实验 ，session 的 顺序 在 被 试 间 平衡 。 


24 数据 采集 及 分 析 


脑 电 数据 由 HANDYEEG 系统 采集 (Micromed, Treviso, Italy), FEX 256 Hz， 电 极 - 头 
皮 间 的 电阻 低 于 5 kQ。 以 左 侧 乳 突 为 参考 电极 。 为 了 与 已 有 的 研究 一 致 (Cheng et al., 2012; 
Zhang et al., 2014)， 实 验 1 考察 F3，F4，C3，C4，P3，P4 共 6 个 电极 点 上 的 脑 电 信号 《图 
2B)。 实 验 2 根据 Cheng 等 人 (2012) 以 及 实验 1 的 结果 ， 简 化 了 数据 采集 操作 ， 仅 考察 F3 
= 和 F4 电极 点 上 的 脑 电信 号 。 
Oo 脑 电 离线 转 为 双 侧 乳 突 平均 参考 , 之 后 分 别 经 过 滤波 (0.01~30 Hz)、 分 段 (-200~1000 ms), 
© SEER TE(-200-0 ms)、 吻 除 幅度 超过 #150 uV 的 试 次 。 本 文采 用 平均 幅度 来 衡量 MMR， 时 


z 


窗 为 语音 刺激 开始 呈现 后 的 300~500 ms (Cheng et al., 2012; Zhang et al., 2014). 


统计 分 析 采 用 SPSS Statistics 20.0 (IBM Corp., Somers, USA)。 描 述 性 统计 量 表示 为 "“ 均 


c 值 十 标 准 差 "。 显 著 性 水 平 为 p<0.05。 多 重 比较 采用 Bonferroni 矫正 。 采 用 Greenhouse-Geisser 
方法 矫正 自由 度 。 对 MMR 的 平均 幅度 进行 双 因素 重复 测量 方差 分 析 ， 两 个 被 试 内 因素 分 别 


为 语音 情绪 类 型 CS. WR TM) 和 电极 点 (实验 1: F3、F4、C3、C4、P3、P4; 实 


验 2: F3、F4)。 

实验 1 在 统计 时 并 未 使 用 传统 的 “差异 波 ”, 而 是 基于 原始 波形 直接 比较 三 种 情绪 条 件 的 
MMR fa BE (Cheng 等 人 (2012) 的 研究 亦 如 此 )。 这 主要 是 因为 与 健康 成 人 的 ERP 数据 相 比 ， 
新 生 儿 数据 的 信 噪 比 非 常 低 〈 主 要 由 运动 伪 迹 造成 )， 因 而 使 用 差异 波 会 引入 较 明 显 的 噪声 

(减法 会 将 标准 刺激 条 件 的 噪声 引入 所 有 的 情绪 条 件 )。 

实验 2 采用 了 偏差 和 标准 刺激 反 转 的 odd-ball 范式 , 需要 计算 由 同一 种 情绪 语音 材料 诱 
发 的 偏差 刺激 和 标准 刺激 间 的 差异 波 〈 例 如 高 兴 条 件 下 的 差异 波 等 于 高 兴 作 为 偏差 刺激 的 
ERP 减 去 高 兴 作 为 标准 刺激 的 ERP)。 考 虑 到 差异 波 的 低 信 噪 比特 性 ， 实 验 2 招募 了 比 实验 
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m 


1 更 多 的 被 试 (18 vs. 29) 以 增强 统计 的 显著 性 。 


Channel locations 


图 2 实验 及 数据 采集 ,A, 新 生 儿 在 实验 中 (图 中 的 显示 屏 用 于 睡眠 -觉醒 状态 的 实时 监测 ); 
B, 实验 1 考察 的 6 个 通道 的 脑 电 电极 位 置 。 


3 结果 
3.1 实验 1 


情绪 的 主 效应 显著 (F(2,34) = 5.27, p = 0.012, n? = 0.235): 高 兴 语音 诱发 的 MMR (此 处 为 
绝对 幅度 3.49 + 1.23 nuV) 显 著 大 于 愤怒 语音 诱发 的 MMR (2.90 + 1.25 uV, p= 0.010); 高 兴 
AREA FAI MMR 无 显著 差异 (3.12 土 1.18 uV, p = 0.138); 恐惧 和 愤怒 条 件 下 的 MMR 无 
显著 差异 (p = 0.893)。 电 极点 的 主 效应 不 显著 (F (5,85) < 1)。 情 绪 和 电极 点 的 交互 作用 显著 


(F(10,170) = 2.41, p = 0.025,m = 0.125; 图 3)。 简 单 效应 分 析 表 明 ， 在 F3 电极 点 上 情绪 效应 


显著 (F(2,34) = 13.94, p < 0.001): 高 兴 语 音 诱 发 的 MMR (3.92 + 1.17 pV) 显 著 大 于 愤怒 语音 诱 


发 的 MMR (2.40 + 1.33 uV, p < 0.001); 高 兴 语 音 诱发 的 MMR 略 大 于 恐惧 语音 诱发 的 MMR 
(3.15 + 1.02 pV, p = 0.059)， 但 仅 边 缘 显 著 : 恐惧 和 愤 奴 条 件 下 的 MMR 无 显著 差异 (p = 
0.077)。 在 F4 电极 点 上 情绪 效应 显著 (F(2,34) = 21.12, p < 0.001): 高 兴 语 音 诱 发 的 MMR (3.88 
+ 1.07 hV) 显 著 大 于 愤怒 (2.77 + 0.90 uV, p < 0.001) RA41A(2.93 + 1.07 uV, p = 0.001) 语 音 诱发 
的 MMR; 恐惧 和 愤怒 条 件 下 的 MMR 无 显著 差异 (p= 1.000)。 在 其 他 四 个 电极 点 ， 情 绪 效 


应 不 显著 (F (2,34) < 1). 
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F3 电 极点 F4 电 极点 


200 400 600 800 1000 


— ti 
一 恐惧 
4 一 
一 高 兴 
一 中 性 
图 3 实验 1 结果 : 三 个 情绪 条 件 及 中 性 条 件 的 MMR 波形 图 (F3 及 F4 电极 点 )。 注 : 中 


性 条 件 的 波形 由 标准 刺激 试 次 县 加 , 由 于 试 次 数量 12 倍 于 三 个 情绪 条 件 , 故 波形 更 光滑 (本 
文 未 将 中 性 条 件 的 幅度 纳入 统计 分 析 )。 


3.2 实验 2 


本 实验 获得 了 三 种 情绪 条 件 作为 偏差 刺激 (图 4A) 和 标准 刺激 的 波形 (图 4B), it 
算出 了 同一 种 情绪 语音 诱发 的 偏差 刺激 与 标准 刺激 之 差 的 差异 波 (图 4C)。 当 情绪 语音 作为 


ij 差 刺激 时 , 与 实验 1 类 似 , 情绪 的 主 效应 显著 (F(2,56) = 6.94, p = 0.002, n? = 0.197; 图 4A): 


高 兴 语 音 诱 发 的 MMR (此 处 为 绝对 幅度 ，3.38 + 1.14 LV) 显著 大 于 愤怒 (2.23 + 1.56 pV, p = 


0.009) FRE TIS 1 AA MMR (2.37 + 1.37 V, p = 0.008); 恐惧 和 愤怒 条 件 下 的 MMR 无 显 
著 差异 (p = 1.000)。 电 极点 的 主 效应 不 显著 (F (1,28) < 1)。 当 情绪 语音 作为 标准 刺激 时 ， 情 
绪 效 应 不 显著 (F(2,56) < 1， 高兴 = 1.45 + 1.06 uV, 慎 怒 = 1.43 +1.19 uV, RIA= 1.54+ 1.15 uV; 
4B)， 电 极点 的 主 效应 不 显著 (F (1,28) < 1)。 对 差异 波 进行 统计 ， 发 现 情绪 主 效应 显著 


(F(2,56) = 4.14, p = 0.021,m3 = 0.129; 图 4C): 高 兴 语 音 诱 发 的 差异 波 (1.97 + 1.64 pA FN 


*8(0.75 + 1.72 pV, p = 0.058; 边缘 显著 ) 和 和 恐惧 语音 诱发 的 差异 波 (0.88 士 1.81 uV, p = 0.048); 


恐惧 和 愤怒 条 件 下 的 差异 波 无 显著 差异 (p = 1.000)。 电 极点 的 主 效应 不 显著 (F (1,28) < 1)。 
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4 实验 2 结果: 三 个 情绪 条 件 的 原始 波及 差异 波 〈 图 


绪 加 


示 数 据 为 F3 和 F4 电极 点 的 均值 )。 


A, 情绪 语音 为 偏差 刺激 ， 中 性 语音 为 标准 刺激 (重复 实验 1) ; B, 情绪 语音 为 标准 刺激 ， 


中 性 语音 为 偏差 刺激 ; C， 同一 种 情绪 语音 诱 


4 讨论 


发 的 差异 波 〔 偏 差 条 件 减 去 标准 条 件 ) 


o 


本 研究 采用 ERP 技术 ,通过 两 项 实验 考察 了 出 生 后 一 周 以 内 的 新 生 儿 (平均 年 龄 3 天 ) 
在 被 动 收听 不 同情 绪 种 类 CS. TR. RTD 的 韵律 性 语音 时 的 大 脑 神经 响应 。 实 验 发 现 
新 生 儿 大 脑 的 额 区 (F3 和 F4 电极 点 ) 可 以 区 分 情绪 性 语音 的 正 负 性 ， 正 性 (高 兴 ) 语音 诱 
发 的 MMR 幅度 明显 大 于 负 性 《愤怒 和 和 恐惧 ) 语音 。 这 一 结果 首次 从 神经 学 层面 ( 电 生 理 指 


标 ) 为 新 生 儿 情绪 性 语音 加 工 的 正 性 偏向 提供 了 证 据 。 


本 文 考察 的 MMR 是 新 异 刺激 ( 较 之 了 


标准 刺激 ) 在 新 生 儿 大 脑 诱发 的 一 个 脑 电 


已 了 


正成 分 ， 


它 相 当 于 成 人 大 脑 额 区 〈 或 额 -中 央 区 ) 产生 的 失 匹 配 负 波 (mismatch negativity, MMN). Hr 
it, MMN 的 峰值 常 出 现在 刺激 呈现 后 150~250 ms， 新 异 刺激 与 标准 刺激 的 波形 相 减 即 得 到 


一 个 负 波 (Naiitinen, Paavilainen, Rinne, & Alho, 2007). MMN 反映 大 脑 对 刺激 间 差 异 的 自动 


化 的 探测 能 力 , 由 于 其 产生 不 需要 注意 的 参与 ， 
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该 成 分 被 认为 是 最 适合 用 于 婴儿 的 脑 功能 研 


FEA ERP 成 分 之 一 。 本 文 及 其 他 新 生 儿 上 听觉 研究 (Cheng et al., 2014; Dehaene-Lambertz, 2000; 
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Friederici et al., 2002; Leppänen et al., 2004; Ruusuvirta et al., 2009; Winkler et al., 2003) 观 察 到 
的 MMR 可 看 作 是 MMN 在 发 育 早期 的 雏形 ,由 于 新 生 儿 的 大 脑 发 育 还 极为 不 成 熟 ， 此 阶段 
的 MMR 表现 为 正成 分 ， 且 潜伏 期 延 后 。 己 有 的 脑 电 溯源 分 析 表 明 MMN/MMR 的 神经 源 在 


H _E (superior temporal sulcus, STS)， 该 脑 区 特别 是 右 侧 STS) 恰好 是 成 人 加 工 情绪 性 语 


音 的 脑 区 (Belin, Zatorre, Lafaille, Ahad, & Pike, 2000; Ethofer et al., 2012). 虽然 由 于 ERP 技术 
的 低空 间 分 辨 率 , 我 们 并 不 能 断言 情绪 性 语音 加 工 的 核心 脑 区 在 新 生 儿 阶段 已 有 相当 程度 的 
功能 分 化 , 本 文 的 结果 至 少 说 明 人 类 出 生 时 即 可 自动 地 分 辨 情绪 性 语音 的 正 负 性 , 且 对 正 性 
情绪 信息 更 加 敏感 。 

本 文 得 到 的 “新 生 儿 对 情绪 加 工 的 正 性 偏向 ”的 结论 不 符合 实验 前 的 假设 ， 即 与 Cheng 
等 人 (2012) 的 实验 结果 相反 。 我 们 认为 可 能 的 原因 有 三 点 。 第 一 ，Cheng 等 人 (2012) 采 用 了 
odd-ball 范式 的 变 式 《〈 随 机 设计 )， 同 时 将 两 种 偏差 刺激 〈 即 高 兴 和 恐惧 语音 ) 以 各 10% 的 
概率 混入 到 标准 刺激 〈 即 中 性 语音 ) 中 ， 继 而 发 现 恐 惧 语 音 诱 发 的 MMR 比 高 兴 语 音 诱发 的 
MMR 更 大 。 本 研究 采用 了 经 典 的 odd-ball 范式 Cblock Kit), AEN, TUS. RAS Fhe 


-一 音 分 别 以 20% 的 概率 混入 到 3 个 block 中 ,发 现 高 兴 语音 诱发 的 MMR 比 愤怒 和 和 恐 惧 语 音 诱 


ot 


CO 发 的 MMR 更 大 。 我 们 认为 ，Cheng 等 人 (2012) 的 随机 设计 在 同一 个 时 间 段 中 混入 了 高 兴 和 
© 恐惧 语音 , 而 这 二 者 诱发 的 正 性 和 负 性 情绪 效应 可 能 存在 一 定 程度 的 相互 抵消 ， 从 而 降低 了 
= 结果 的 有 效 性 。 当 然 ， 两 种 odd-ball 方案 中 哪 种 更 适用 于 考察 本 问题 还 有 待 进一步 讨论 ， 此 


处 仅 提供 两 项 研究 结果 不 一 致 的 可 能 原因 。 第 二 ，Cheng 等 人 (2012) 的 实验 在 新 生 儿 清醒 或 
睡眠 时 均 有 进行 ， 而 本 研究 严格 控制 了 被 试 的 状态 ， 即 仅 在 新 生 儿 的 “活动 睡眠 ”阶段 (类似 
于 成 人 “快速 动 眼 睡眠 ”阶段 ) 采集 ERP 数据 。 考 虑 到 MMN/MMR 会 受到 睡眠 -觉醒 状态 


影响 (Hirasawa et al., 2002; Zhang et al., 2014)， 这 也 可 能 是 两 项 实验 结果 不 一 致 的 原因 。 第 
三 ， 由 于 眼 动 、 体 动 等 运动 伪 迹 ， 新 生 儿 ERP 数据 的 信 噪 比 远 远 低 于 成 人 数据 ， 降 低 了 单 
次 实验 结果 的 可 靠 性 。 因 此 , 我 们 认为 继续 进行 系列 实验 才能 对 “新 生 儿 情绪 偏向 ”问题 给 出 
准确 的 回答 。 

本 文 继 Mastropieri 等 人 (1999) 和 Farroni 等 人 (2007) 的 行为 学 实验 , 首次 提供 了 新 生 儿 情 
绪 加 工 正 性 偏向 的 神经 电 生 理 证 据 。 除 了 直接 考察 新 生 儿 对 正 负 性 情绪 的 加 工 , 还 有 一 些 研 
究 也 从 侧面 支持 了 新 生 儿 的 正 性 情绪 偏好 。 例 如 , 不 少 研 究 发 现 , 与 “成 人 用 语 ”(adult-directed 


speecb 相 比 ， 新 生 儿 更 偏好 “婴儿 用 语 ”(infant-directed speech， 一 种 提高 音调 、 加 重重 音 、 


语调 更 欢快 的 说 话 方式 ) (Cooper & Aslin, 1990; Singh, Morgan, & Best, 2002), “婴儿 有 用语? 而 
非 “ 成 人 用 语 ” 可 显著 激活 新 生 儿 的 额 区 (Saito et al., 2007)。 另 外 ， 与 陌生 人 的 声音 相 比 ， 新 
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生 儿 更 喜欢 母亲 的 声音 (DeCasper & Fifer, 1980)。 这 些 发 现 的 可 能 原因 之 一 是 儿 语 和 母亲 的 


声音 通常 表现 出 更 多 的 积极 情绪 (Saito, Fukuhara, Aoyama, & Toshima, 2009; Singh et al., 
2002)， 因 此 它们 可 作为 正 性 情绪 偏向 的 间接 证 据 。 前 文 已 指出 ， 虽 然 “ 负 性 偏向 ”是 情绪 加 
工 中 的 一 个 普遍 现象 , 但 该 偏向 仅 当 婴 儿 发 育 到 6~7 月 龄 之 后 才能 被 稳定 地 观察 到 , 而 此 前 
婴儿 似乎 对 正 性 情绪 信息 更 感 兴趣 (Vaish et al., 2008)。 情 绪 加 工 偏 好 由 正 性 向 负 性 的 转变 可 
以 通过 “范围 -频率 假说 "(range-frequency hypothesis; Parducci, 1995) 进 行 解释 。 简 言 之 ， 新生 
儿 及 小 婴儿 在 日 常生 活 中 频繁 地 接收 到 来 自 抚养 者 的 积极 情绪 信号 , 习 得 抚养 者 的 正 性 情绪 
线索 (例如 高 兴 的 声音 或 表情 ) 与 良好 照料 〈 拥 抱 、 抚 摸 、 喂 食 ) 的 联结 会 使 他 们 从 抚养 者 
那里 得 到 更 多 生理 养分 和 心理 抚慰 。 相 反 ， 此 阶段 他 们 暴露 在 负 性 情绪 环境 中 的 概率 极 小 ， 
同时 由 于 他 们 的 运动 能 力 不 足 , 无 法 主动 逃避 危险, 即使 他 们 对 负 性 线索 加 强 了 关注 也 并 不 
能 获得 明显 的 生存 优势 。 直 到 6~7 月 龄 之 后 ， 婴 儿 运 动能 力 快 速 发 展 ， 他 们 开始 主动 探索 周 
边 世 界 ， 伴 随 而 来 的 是 来 自 抚养 者 的 逐渐 增多 的 负 性 提示 例如 父母 惊 如 的 表情 或 呵斥 )， 


婴儿 此 时 需要 对 这 些 负 性 信息 进行 更 快 和 更 准确 的 加 工 (例如 Grossmann et al., 2005; 2010; 


Hoehl & Striano, 2010; Peltola et al., 2009)， 从 而 使 自己 免 受 或 少 受伤 害 。 因 此 ， 岗 儿 出 生 后 
先 表 现 出 对 情绪 加 工 的 正 性 偏向 , 之 后 再 发 展 为 负 性 偏向 , 这 对 人 类 早期 的 发 育 和 发 展 具 有 
重要 作用 。 认识 此 情绪 加 工 的 发 展 规律 有 利于 我 们 制定 更 科学 的 育儿 方案 , 同时 可 帮助 我 们 
及 早 发 现 情绪 和 认 知 发 育 有 障碍 的 患 儿 (例如 自 闭 症 患 儿 )。 

总 结 来 说 ,本 研究 试图 回答 两 个 问题 : 新 生 儿 能 否 区 分 不 同 种 类 的 情绪 ?他 们 对 情绪 信 
息 的 加 工 是 否 存 在 正 性 或 负 性 偏向 ?实验 采用 了 经 典 的 odd-ball 范式 以 及 偏差 和 标准 刺激 
反 转 的 odd-ball 范式 ， 在 三 个 block 中 分 别 考 察 高 兴 、 慎 怒 、 恐 惧 三 种 语音 诱发 的 MMR。 
两 项 实验 的 结果 一 致 证 明 , 新 生 儿 大 脑 可 自动 辨别 正 性 与 负 性 情绪 语音 , 但 尚 不 能 将 愤怒 和 
恐惧 两 种 负 性 语音 区 分 开 来 。 更 重要 的 是 ,高 兴 语 音 比 两 种 负 性 语音 诱发 了 更 大 的 MMR IE 
FE, 这 一 结果 从 神经 电 生理 的 层面 证 实 了 新 生 儿 对 情绪 语音 加 工 的 正 性 偏好 。 我 们 认为 出 生 
后 的 这 种 正 性 偏好 是 符合 进化 规律 的 一 种 认 知 模式 , 它 可 以 帮助 人 类 在 宫 外 发 育 的 最 早期 获 
得 更 多 的 食物 和 抚养 者 的 关爱 。 
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Abstract 


Our ability to process emotional prosody, that is the emotional tone of a speaker, is 
fundamental to human communication and adaptive behaviours. Very early in development, vocal 
emotional cues are more critical than facial expressions in guiding infants' behavior. However, the 
processing of emotional prosody in the very early days of life is still far from clearly understood. 
It is unclear whether the discrimination between prosodies with different emotional categories is 
present at birth. Furthermore, it is unknown whether there is a preferential orientation (negativity 
bias versus positivity preference) in neonates. 

Here, we used event-related potentials (ERPs) to examine the ability of neonates (from 1 to 6 
days old) to discriminate different types of emotions conveyed by speech prosody. The experiment 
was conducted in the neonatal ward of Peking University First Hospital, Beijing, China. 
Electroencephalogram recording was carried out when the infants were in a state of active sleep. 
Using an oddball paradigm, the current study investigated the neural correlates underlying 
automatic processing of emotional voices of happiness, fear and anger in 18 (Experiment 1) and 
29 (Experiment 2) sleeping neonates. In Experiment 1, each category of emotional prosody (20%) 
was separately mixed into emotionally neutral prosody (80%), forming three blocks with different 
emotions. In Experiment 2, we not only repeated the procedure of Experiment 1, but also reversed 
the standard and deviation stimuli in the odd-ball task. 

Event-related potential data showed that the frontal scalp distribution (F3 and F4) of the 


neonatal brain could discriminate happy voices from both angry and fearful voices; the mismatch 
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response (MMR) was larger in response to the deviant stimuli of happiness, compared with the 
deviant stimuli of anger and fear. However, the latter two stimuli, i.e., angry and fearful voices 
could not be differentiated. The MMR amplitudes at the other four electrodes, i.e., C3, C4, P3, and 
P4 did not show significant differences across emotional conditions. Note: the MMR is a 
prototype of the mismatch negativity, i.e. a preattentive component of the auditory ERP that shows 
a positive (MMR) or negative (MMN) displacement in response to deviant sounds compared to 
standard sounds in the oddball paradigm. 

The neural responses recorded here indicate very early preference for positive over negative 
stimuli, which is contrary to the ‘negativity bias’ phenomenon established in the affective prosody 
literature of adult and infant studies. It is suggest that the range-frequency hypothesis could help to 
interpret the transformation from the ‘positivity preference’ during the first half year of life to the 
‘negativity bias’ later in development. The present finding provides the first 
neuroelectrophysiological evidence for the hypothesis of positivity preference in neonatal 
participants. In addition, this special discrimination between positive and negative prosody in 


early life may provide a foundation for later emotion and social cognition development. 


keywords: neonate; positivity preference; happy prosody; fearful prosody; angry prosody 
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